GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude 3几乎达到百分百的正确率。
小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude 3几乎达到百分百的正确率。
【新智元导读】Claude 3在通用任务上是全球最强已经毋庸置疑。更令人惊叹的是,它在专业领域的表现,比如化学任务,也能远远领先GPT-4。
太疯狂了!Claude 3 Opus竟然干掉了GPT-4。在Chatbot Arena最新的聊天机器人对战排行榜中,Claude 3的超大杯成功登顶,就连最小的Claude 3 HaiKu都达到了GPT-4水平!
GPT-4真的被反超了!大模型竞技场上,Claude 3大杯Opus新王登基,Elo分数来到榜首。
Claude 3不但数据集跑分领先,用户体验上也将成为最强大的LLM,GPT-5在哪里?
Claude3凭什么这么强?春天到了,和万物一起竞发的,还有愈发火热的AI。自2月以来,国外头部AI企业大招连出,纷纷推出了一系列强大的AI模型或技术。除了在AI圈刷屏刷到爆的Sora以外,另一匹黑马Claude 3也在三月份杀出,直接夺取了GPT-4最强大模型的地位。
“Claude 3、Gemini 1.5,是要把RAG(检索增强生成)给搞死了吗?”
一年一度的阿里全球数学竞赛又开始了。本届最大的亮点,首次向硅基AI开放,最高可摘得1万美金大奖。不用等了,带着你的AI来挑战吧。
Claude 3 一经推出,AI 初创公司 Anthropic 被推上了大模型浪潮顶端。这一波压力立马给到了 OpenAI。不少网友调侃,GPT-5 呢?
突然间,AGI已经成为了一个新的「5年内实现」的未来技术。从Altman到老黄,都在不同场合表示,达到人类智能水平的AI将很快到来。而技术路径和未来可能出现的能源短缺,可能是达到AGI过程中的最大变数。